package com.ysq.excavator.service;

import java.util.List;

import com.ysq.excavator.content.SplitWord;

public interface HtmlContentService {

	void test();
	
	/**
	 * 通过 url 获得正文
	 * @param url
	 * @return
	 */
	String getUrlContent(String url);
	
	/**
	 * 将正文信息分词
	 * @param contentText
	 * @return
	 */
	List<SplitWord> splitContentWord(String contentText);
	
	/**
	 * 过滤正文分词
	 * @param contentText
	 * @return
	 */
	List<SplitWord> filterSplitWord(String contentText);
	
}
